Quo Vadis Covid-19?



Actividades

0) a) Analizar el datasets (columnas y datos de las filas), calcular estadísticos descriptivos, analizar valores nulos y su significado. Concluir al respecto sobre la cantidad/calidad/estructura de los datos.

b) Realizar gráficos que considere convenientes para presentar los datos

c) Identificar eventos anómalos y analizar la posible causa de acuerdo a la fecha

1) Analizar situación en nuestra provincia vs otras considerando cantidad de infectados y fallecidos. Calcular indicadores que resulten de interes de acuerdo al problema.

2) a) Agrupar datos de provincias a modo de obtener valores totalizados por país.

b) Encuentra países con valores sospechosos? Cómo los identifica?

3) a) Graficar evolución de cantidad de casos de nuestro país y países de la región con respecto al tiempo.

b) Realizar análisis similar considerando países de diferentes continentes. Concluir acerca de formas de las curvas de los países analizados y su etapa en el control del covid. 

4) a) Realizar grafico comparativo de cantidad de casos por país de modo que resulte fácil identificar la situación de cada uno de éstos (puede usar información geográfica https://plotly.com/python/maps/).

b) Replicar el mismo considerando provincias.

Opcional: Generar gráfico de avance de cantidad de infectados mundial animado por tiempo (https://plotly.com/python/sliders/)

Análisis y Curación de Datos

Adding columns for 'New cases' and 'New deaths

Fixing proper type of objects to observed cases

Search and drop of negative values (if not significant)

We found few negative values for the New cases and New death series respectively. The importance of these variables are lower than 0.5% per serie. So, it would be ok to transform these variables as null

Adding Weekdays

Adding population

US is as United States, renaming

Adding a IncomeGroup column as ordinal

Transforming series in logs and adding Infection and Mortality rates

Creating a subset without NaN

Adding a trend series (starting from the first day case)

Analysis y Visualización de datos

Average Statistics (see following cells)

La nueve primeras columnas muestran los estadísticos desde el día que empezaron los casos, mientras que las nueve siguientes muestran los estadísticos desde el día que todos los países empezaron a sumar casos.

La media indica, en teoría, el numero de nuevos casos que cada país debería tener si la distribución del Covid19 fuera similar en todos los países.

Como es de esperar la media por día de casos es mayor en el segundo caso.

La cuatro primeras columnas muestran los estadísticos desde el día que empezaron los casos, mientras que las cuatro siguientes muestran los estadísticos desde el día que todos los países empezaron a sumar casos.

La media indica, en teoría, el numero de nuevos casos que cada país debería tener si la distribución del Covid19 fuera similar en todos los países.

Como es de esperar la media por día de casos es mayor en el segundo caso.

Distribución de la media, diaria y diaria con casos

La distribución de la media diaria de casos, no es tan representativa, al ser una variable con media variante (los casos suben, llegan a un máximo y luego bajan), pero provee cierta información respecto a la expansión del virus. Así vemos que la cola del box-plot ha excedido en 1.5 veces tanto su desviación estandar.

Si la distribución de la media diaria con casos se hiciera según trend, hay presencia de various outliers porque es más comparativo, que en el caso de casos diarios asignando casos a días en los que ciertos países no tenían casos todavía

La evolución de la media diaria es similar a la evolución del total mundial (en cada período se divide la muestra sobre el número de países del dataframe, que es constante a lo largo del período de análisis). Tanto la evolución linear de casos confirmados y de muertes son similares, sin


embargo la versión logaritmica indica la concavidad de los datos y la existencia de un máximo, que implicaría el control de la epidemia.

ARGENTINA

Desde que se observaron casos en Argentina, se han observado, en promedio, cerca a los dos mil casos por día y por provincia. Si tenemos en cuenta que los casos estan concentrados en el AMBA y chaco, los datos son preocupantes para esas provincias. El geomap de la Argentina mostrará estas divergencias más adelante.

Visualización view

The World

Mientras que los casos de confirmados son resonantes en algunos países como EE.UU, Brazil y Mexico. Los lideres en casos confirmados también son lideres en decesos, sin embargo el mapa de decesos hace más visible los efectos del Covid-19 en otros países, v.g. países Europeos.

Esta regularidad se mantiene en Argentina, al comparar casos confirmados y decesos (ver gráficos debajo).

Si se lográ la ansiada inmunidad comunitaria, antes de la vacuna, los países con más casos mostrarán menos decesos y la regularidad observada entre confirmados y fallecidos resaltará aún más.

ARGENTINA

Distribution Plots

Al principio todos los países exhiben un pico, luego la tendencia determinará la estructura multimodal o no de cada serie. Refierendonos a los máximos diferentes a los de iniciales, observamos que:

En EE. UU. los casos confirmados exhiben dos máximos , mientras que en los casos fallecidos tiene un solo máximo. Perú también tiene dos picos, pero esta regularidad lo manifiesta en los casos de confirmados y fallecidos.

Argentina exhibe solo un máximo en confirmados, pero una regularidad oscilante en el caso de decesos.

LINEAR & LOG EVOLUTION

Lo que nos muestra la evolución de los casos confirmados

ARGENTINA

Seasonal decomposition and Facebook Forecasting Model

Seasonal decomposition

Case Model Peru

Applying Facebook Forecasting Method

In order to taking into account up or down jumps and make trends flexible we scale the series as suggested by the Prophet guide (in this case, it is in logs and the scale does not affect much).

Death cases, full application

Brazil Case

Time Series Clustering

Organizing the data

Applying clustering methods

Organizing data for visualization

Applying to New Monthly cases

Thanks